R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística
Percy Soto-Becerra M.D., M.Sc(c)
InkaStats Data Science Solutions | Medical Branch
@github/psotob91
Agosto 06, 2022
R es un lenguaje de programación estadística de código abierto.
R también es un entorno para computación estadística y gráfica.
Está potenciado con paquetes.
Objeto:Cualquier abstracción en R. Los datos son objetos en R.
Función:Código capaz de realizar una acción específica con los datos. También es un objeto: un objeto que actúa sobre otros objetos.
Paquetes:Library en inglés. Conjunto de funciones que realizan acciones a menudo relacionadas en R.
Paquetes de R base:Conjunto de paquetes instalados por defecto en R.
Paquetes de R tidy:Conjunto de paquetes que siguen el estilo tidy en R.
Los paquetes son las unidades fundamentales del código reproducible en R.
Al 13 de junio de 2022, hay 18 560 paquetes disponibles.
¡Trabajaremos con un pequeño (pero importante) conjunto de estos!
Cada paquete contiene una o más funciones que ejecutan tareas.
¡Hay paquetes de todo tipo y para todos los gustos!
Tidyverse es una colección grande de paquetes de R diseñados para hacer ciencia de datos.
Todos los paquetes comparten una filosofía subyacente y una gramática común.
R, como todo lenguaje, tiene varios dialectos.
Dos dialectos predominan: R base y R tidy.
R tidy se basa en la filosofía de tidyverse.
Usaremos este enfoque predominantemente y R base cuando no tenga remplazo o sea más sencillo usarlo.
El código se escribe en el Script, pero no se imprime.
Los resultado se imprimen en la consola.
Aunque es útil usar la consola, es preferible usar herramientas de programación literaria: RMarkdown o Quarto.
rmarkdown y quarto permiten a los usuarios de R escribir su código y prosa en documentos computacionales reproducibles.
Por lo general, nos referimos a documentos R Markdown con la extensión .Rmd y a los documentos Quarto con la extensión .qmd.
Herramientas de programación literaria:
Útiles para alcanzar reproducibilidad.
También muy útiles para diversas actividades académicas:
Presentaciones académicas
Artículos científicos
Diseño de blogs, web u otra herramienta de difusión de conocimiento.
Cada ejercicio / reporte / proyecto / tarea / etc. será hecho en un documento R Markdown aumentado: Quarto.
Siempre te proporcionaremos una plantilla de documento Quarto para iniciar.
Las plantillas irán modificándose conforme avancemos el curso.
Las plantillas son simplemente eso, plantillas, para usarlas en su día a día no necesita pensar mucho en ellas ni entenderlas a detalle.
Yo entiendo menos del 20% de estas y aún así me sirven mucho para mi trabajo diario. ¡Sugiero comenzar haciendo lo mismo!
Introducción a R y RStudio